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® Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie 
Vorrichtung und Verfahren zum Codieren eines Audiosignals 

© Ein Verfahren zum Erfassen eines Anschlags in einem 

zeitdiskreten Audiosignal wird vollstandig im Zeitbereich 

durchgefuhrt und umfaftt den Schritt des Segmentierens 

des zeitdiskreten Audiosignals, um aufeinanderfolgende 

Segmente gleicher Lange mit ungefilterten zeitdiskreten 

Audiosignalen zu erzeugen. Das zeitdiskrete Audiosignal 

in einem aktuellen Segment wird anschliefcend gefiltert. 

Nun kann entweder die Energie des gefilterten zeitdiskre 

ten Audiosignals in dem aktuellen Segment mit der Ener- 
gie des gefilterten zeitdiskreten Audiosignals in einem 

vorhergehenden Segment verglichen werden, oder es 

kann ein aktuelles Verhaltnis zwischen der Energie des 

gefilterten zeitdiskreten Audiosignals in dem aktuellen 

Segment und der Energie des ungefilterten zeitdiskreten 

Audiosignals in dem aktuellen Segment gebildet werden 

und dieses aktuelle Verhaltnis mit einem vorhergehenden 

entsprechenden Verhaltnis verglichen werden. Auf der 
■ Grundlage des einen Vergleichs und/oder des anderen 
. Vergleichs wird erfafct, ob in dem zeitdiskreten Audiosi- 
* gnal ein Anschlag vorhanden ist. 
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Beschreibung 

Die vorliegende Erfindung beziehi sich uul'dic Codierung von Auriiosignulcn unci insbesonderc uufdas Codieren von 
Audiosignalen, die An sen luge a u Two i sen. d. h. die transient sind. 
5 Bei der gehorangcpaBien Codierung zur Daienreduktion von Audiosignalen erfolgt die Codierung der Audiosignale 
zumeisi ini Frequenzbcreich. Dies bedeuiet.daB Ausgangswerie einer Zeit-Frequenz- Transformation quantisieri werden 
und anschlieBend in eincn Bilstroni geschrieben werden, welcher gespeichert oder uhertragen werden kann. I tin psycho- 
akusiisches Model 1. das in dem Codierer implcnicnticn ist. bcrechnel cine nionieniane Milhor- oder Maskierungs- 
schwclle und sieuerl die Quaniisicrung der Ausgangswerie der Zx'ii-Frequenz-Transformation so. daB der Codicrungs- 

10 fehler, d. h. der Quaniisicrungsfchler. spekiral gefonm wird und umer dieser Schwelle liegi, daniii derselbe unhorbar isi. 
Durch diese MaBnahnic ist der Codierungsfchler jedoch zeillich iiber der Zahi von Abiastwerien konstani, welebe der 
Langc des Translonnationsfenstcrs enispricht. Die Mithor- oder Maskierungsschwelle ist in M. Zollner. E. /wicker. 
Hlckiroakusiik, Springer- Verlag, Berlin. Heidelberg, New York. 3. Auflage. 1993 dargestelli. 

Uni die Bercchnung der Miihorschwelle ini Frequenzbcreich moglichsi exaki durchfiihren zu konncn. isi eine hone 

15 Frequenzauflosung der Zcii-Frcquenz- Transformation erfordcrlich. Bei praktischen Anwendungsfallen konncn typische 
Transformationslangen ini Bereich von 20 bis 40 nts auftreien. Werden nun transienie Audiosignalen, d. h. Audiosignale 
mil Anschlagen, verarbeitet, so verieilt sich je nach zeitlicher Posilion des Anschlags ini Translonnationsicnster das 
Quaniisierungsgerausch zcitlich auch "vor" das Maximum der Signalhiillkurve. Aufgrund der incnschlichen Wahrnch- 
mung konncn diese sogenannlen "Vorechos" horbar werden, wenn sic inehr als 2 ins vordeni cigcnilichcn Anschiag des 

20 zu codierenden Audiosignals einsctzen. Dies ist der Grund, daB bei vie Ion Transformationscodierern die Trans formati- 
on si a nge der Zeii- Frequenz-Transformation auf kiirzere Fensier. d. h. kiirzere Block I an gen. mit einer zcit lichen La nge 
von typischcrweise 5 bis 8 ins mil einer damil hdheren zeitlichen Auflosung unischalibar isi. Dies ermoglichi eine zeil- 
lich feinere Fomiung des Quantisicrungsgcrausches und damit eine Unterdruckung dieser Vorechos. wodurch dieselben 
nicht mehr oder nur sehr wenig horbar sind, wenn das codierien Signal wieder in einem Decodierer decodiert wird. 

25 Es werden also Vbrrichtungen zum Erfasscn eines Anschlags in eineni Audiosignal verwendci, urn die Tran s format i- 
onslange der Zeii-Frequenz-Transfonnation gehorrichlig an die Eigenschaften und insbesonderc an die transienten Ei- 
gcnschaficn des Audiosignals anzupasscn. 

Fig. 3 zcigt einen bekannien Transformalionscodierer 100. der allgemein nach dem Standard MPEG 1-2 Layer3 (ISO/ 
IEC IS 1 1172-3. C oding of Moving Pictures and Associated Audio, Part 3: Audio) aufgebaut ist. Ein Zeilsignal gelangl 

30 iiber einen Eingang 102 in einen Block Zeii/Frequcnz-Transformalion 104. Das Zeit signal am Eingang 102, das lypi- 
scherweise als /xitdiskretcs Audiosignal vorliegt, das mittels einer Ahtasteinrichlung (nicht gezeigt) aus einem zeitkon- 
tinuierlichcn Zeilsignal crhaiten wurde, wird durch den Block Zeit-Frequenz -Transformation 104 in auicinanderfol- 
gende Blocke von Spektralwcrten transforniiert, welche in einen Block Quaniisierung/Codierung 106 cingegeben wcr^ 
den, wobei das Ausgangssignal des Blocks Quaniisierung/Codierung quaniisierte und Redundanz-codierte digilale Si- 

35 gnale sind, welche in einem Block Bitstroniformatierung 108 zusammcn mil notigen Scilenin formal ionen zu eineni Bit- 
sirom gebildei werden. der am Ausgang der Bitstromfoniiatierungscinrichtung 108 anliegl und gespeichert oder ubertra- 
gen werden kann. 

In dem Block Zeit/Frequcnz- Transformation 104 findet eine Fensterung des zeildiskreten Audiosignals am Eingang 
102 stall, um aufeinanderlolgende Blocke mit zeildiskreten Audiosignalen, welche nun gefcnsieri sind, zu crzeugen. Die 

40 Blocke der gclensterien zeildiskreten Audiosignale werden anschlieBend. wie es bereils crwahnt wurde, in den Frequenz- 
bereich translormicri. Wie es aus der Nachrichieniechnik bckannt ist, isi die Frequenzauflosung der Zeil-Frcquenz- 
Transfonnaiion durch die Langc eines Blocks vorgegeben. Um fur zeiidiskrctc Audiosignale mil Anschlagen, d. h. mit 
transienten Anteilcn, eine ausreichende zeitliche Aufidsung zu erreichen, ist es noiwendig, daB zur Codierung derselben 
zur Vermeidung der Vorechos die Fensierlangc und damit die zeitliche Lange eines Blocks zeitdiskreter Abtaslwerte ver- 

45 kiirzt wird. 

Der in Fig. 3 gezeigte bekannic Codierer fiihrt folgendes Verfahren zum Erfassen von Anschlagen in eineni Audiosi- 
gnal durch. Aus dem Block Zeil/Frequen /-Transform at ion 104 werden die Speklralkoniponenten in einen Block psycho- 
akusiisches Mode 11 110 eingespeist, wobei der Block 110 zum einen, wie es bercits eingangs erwahnt wurde, die Mas- 
kierungs- oder Miihorschwelle fiir den Block Quaniisierung/Codierung 106 erniittclt. sowie zum andcrcn aus dem vor- 
50 licgenden Signalencrgieverlaui des zeildiskreten Audiosignals ini Frequenzbcreich und dem crrechneien Energievcrlauf 
der Miihorschwelle einen Schaizwcrt fiir den Bilbcdarf zur Codierung des Spektrums ermillelt. Dergeschatzie Bilbedart, 
der in der Fachwelt auch "Perceptual Entropy" oder kurz "pe" genannt wird. herechnel sich aus folgendcm Zusammen- 
hang: 

' ^-S><logJ^ + l (l) 

In Gleichung (1) bedeuien N die Anzahl der Spck trail ini en eines Blocks, e(k) die Signalenergie der Spektralkompo- 
60 nenten oder Spektrallinien k und n(k) die erlaubte Slorenergie der Finie k. Ein Anst.ieg dieser Perceptual Entropy von ei- 
neni Transfomiationsfensierzum nachsten, welcher einen gewissen Schwellcnwen, der als "switch_pe" bczeichnet wird, 
ubcrsieigl, dient hier als Indikator fur einen Anschiag. Wird der Schwellcnwcrt swilch„pe ubcrschritten. so wird in dem 
Block 104 von einem langen Fenster zu eineni kurzen Fensier umgeschaltci. um zeillich kiirzere Blocke zeitdiskreter Au- 
diosignale zu erzeugen, um die Zeitauflosung des Trans format ion scodi ere rs 100 zu erhohen. Die Berechnungsvorschrift, 
65 die in Gleichung (1) dargelcgt ist, sowie die Festlegung des Schwellcnwens swiich„pe werden in eineni Block Bitbe- 
darfsschatzung 112 festgclegt . Das Ergebnis der Bilbedarfsschatzung 112 wird der Zeil/Frequenz-Transfoniiaiion 104 
sowie dem psychoakuslischen Model 1 110 miigeleill, wie es in Fig. 3 angedeulet ist. 

Ein Nacineil dieses bekannien Verfahrcns bestehi darin. daB die Infomiationen iiber einen moglichen Anschiag oder 
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"Attack" erst nach der Berechnung des psychoakustischen Modells zur Vcrfiigung sichen. Dies wirki sich insbesondere 
nachteilig aui" die zeitliche Ablaufsiruklur des Codierers aus, da cine Ruckkopplung dcr Fensterinformationen /.uni psy- 
choakusiischen Modell crfolgen mutt. Weilerhin wirken sich Anderungcn an Parameiern zur Berechnung der Mithor- 
schwelle inimer auch auf den Wen dcr Perceptual Entropy aus. Veranderungen dieser Parameter verandern daher iinnier 
auch die Fenstersequenz. d. h. die Folge von langen und kurzen Ecnstern. der Transformation. 5 

Fig. 4 zeigi einen weiteren bekannten Transfonnaiionscodierer 150. der im prinzipicllcn Aufbau dent Transformation- 
scodierer 100 ahncli. Insbesondere umfaBl. dcrsclbc ebenfalls den Eingang 102 fur zeitdiskrete Audiosignaie, welche in 
dent Block 104 gefensten und in den Erequenzbercich trans formic n werden. In den i Block 106 werden die spcktralcn 
Ausgangswcrte des Blocks 104 umcr Bcrucksichtigung des psychoakustischen Modells 110 quantisiert und ansehielSend 
codien, uni zusammen mil Seiteninformationen durch die Bitstromfomiaiicrungseinrichtung 108 in einen ausgangsseiii- id 
gen Bitstroni gcschricbcn zu werden. 

Der Transfonnaiionscodierer 150, der in Fig. 4 gczeigi ist. unterschcidct sich von deni Transfbrmationscodierer 100. 
der in Fig. 3 gczeigi ist, in der Erfassung von Anschiagen in dem Audiosignal. Die Krfassung von Anschiagen in dem 
Audiosignal ani Eingang 102. die in Fig. 4 dargestcllt isi, ist in dem Standard MPEG 2 AAC (sichc ISO/EEC IS 1 3818-7, 
MPEG-2 Advanced Audio Coding (AAC)) beschrieben. Der Block FFT- Transformation und Dctekiion aus dem Spek- 15 
trum 152 fiihn eine Erfassung von Anschiagen iniuels cines spcktralen Energieanstiegs durch. Insbesondere wird das 
zeitdiskrete Audiosignal am Eingang 102 zuerst mittels eincr FTT- Transformation in den Frequenzbcreich t ran s lorn licrt. 
wobei die Lange der PI T- Transfonnation der Transformaiionslange der kurzen Fenster entspricht. AnschlieBend werden 
die FTT-Energien in den sogenannten "Critical Bands" bcrechnci. Die "Critical Bands" stellen eine Ercquenzgruppierung 
dar, die dcr Aullosung des psychoakustischen Modells entspricht. Ein Schwellwenvergleich der einzelnen Bandenergien 20 
ubcr eines oder mehrerc zeillich aufeinanderfolgende Fenster Helen nun ein Indiz fur einen Anschlag. 

Im Gcgensatz zu dem in Pig. 3 dargestelltcn bekannten Verfahren vcrmeidet das in Fig. 4 dargcstellte bckannte Ver- 
fahren den Nachteil der Riickkopplung der Fensterinformationen zum psychoakustichen Modell 110. Das in Fig. 4 dar- 
gestelltc Verfahren konnte prinzipicll unabhangig vom psychoakustischen Modell vor dessen Berechnung angewendct 
werden. Das in Fig. 4 dargestellle Verfahren benoiigt jedoch eine an die Transformaiionslange des Codierers angepaBtc 25 
FFT-Transfonnaiion zur Berechnung der Energien in den einzelnen Frequenzgruppen. 

Aus dcr IT^ 2741743 Al ist hcrcits ein Verfahren zum Vcrbcsscrn dcr Erkcnnbarkcil cines Wortcs in eincm Sprachvcr- 
schlussclungsgerat mil niedrigcr Datcnratc bckannt, bci dem ein Musiersprach signal in Rahmen von vorgegebener Zeii- 
dauer zerlegt wird. wobei jedeni Rahmen ein Pradiklionshllcr zugeordnet wird. dessen Koefiizicnten untcr Beriicksich- 
tigung der Anordnung stabileroder instabiler Mustersignale ennitlelt sind. Zum Zwecke dcr Bestimmung der stabilen :*o ,^ 
oder unstabilen Eigenschaft des Mustersignals wird jeder Rahmen in cine vorbesiimmie Anzahl von Teilrahmen zerlegt, ^ 
die Leistung des Signals in jedem Teilrahmen ennitlelt. und eine Anzahl von Leistungsniessungen in jedeni Teilrahmen - 
fur das verbliebenc Signal am Ausgang des Pradiktions ft Iters wiihrend eines Zeilfensters vorgenommen. wobei die erhal- 
teiien Leistungsmessuugen niit der Mustersignalenergie des entsprechendeii Tcilrahmens verglichen wird. 

Die Aufgabe der vorliegcndcn Erfindung besteht darin, ein Verfahren und eine Vorrichiung zum Erfassen eines An- :*5 
schlags in eineni zeildiskreten Audiosignal sowie ein Verfahren und eine Vorrichiung zum Codieren von Audiosignalen ^ 
zu schaffen. welche auf effizicnie und einfache An und Weise eine zuverlassige Erfassung von Anschiagen und somit 
eine einfache Untcrdriickung von Vorechos ennoglichen. ^ 

Dicse Aufgabe wird durch ein Verfahren zum Erfassen eines Anschlags gemaR Anspruch 1, durch eine Vorrichiung 
zum Erfassen eines Anschlags gcmaB Anspruch 11, durch eine Vorrichiung zum Codieren eines zeitdiskrelcn Audiosi- 40 r + 

gnals gemafi Anspruch 14 und durch ein Verfahren zum Codieren eines zeildiskreten Audiosignals gemaB^Anspruch 15 
gelost. 

Der vorliegcndcn Erfindung liegt die Erkenntnis zugrunde, daR ein Anschlag in eineni Audiosignal mil eincm zeitli- 
chen Anstieg dcr Signalcnergie des Audiosignals einhergeht. Ferner lost ein Anschlag einen Anstieg der Energie von ho- 
hcrfrequenten Signalanleilen in dem Audiosignal aus, da ein Anschlag typischcrweise durch schnelle zeitliche Anderun- 45 
gen des Audiosignals gekennzeichnet ist. 

Ein Verfahren zum Erfassen eines Anschlags in eineni zeildiskreten Audiosignal umfaRl soruit folgcnde Schrilte: 

(a) Segmcntieren des zeitdiskrelcn Audiosignals, urn aufeinanderfolgende Segmente gleicher Lange mit ungefilter- 

len zeildiskreten Audiosignalen zu crzeugen; 50 

(b) Filiern des zeitdiskrelcn Audiosignals in eineni aktuellen Segment: 

(c) Vergleichen der Energie des gefiherten zeildiskreten Audiosignals in dem aktuellen Segmeni mit der Energie 
des gefilicnen zeildiskreten Audiosignals in einem vorhcrgchenden Segment ; und/oder 

(d) Be slim men cines aktuellen Verhaltnisses zwischen der Energie des ge fil ten en zeildiskreten Audiosignals in 
dem aktuellen Segment und der Energie des ungefilterten zeitdiskrelcn Audiosignals in dem aktuellen Segment und 55 
Vergleichen des aktuellen Verhaltnisses mil einem cntsprechenden vorhcrgchenden Verhalinis; und 

(e) Erfassen eines Anschlags auf der Grundlage des im Schritt (c) und/oder im Schritt (d) gefiihrten Vergleichs. 

Bci einem bevorzugten Ausfuhrungsbeispicl wird das Filiern mittels eines HochpaB filters ausgefiihrt, es sind jedoch 
auch andere Filterungen tnoglich, z. B. mitt els eines BandpaRfi Iters, eines Differcn/.ierers erster oder hoherer Ordnung fio 
oder ahnlichem, solange sich das gefillertc zeitdiskrete Audiosignal hinsichllich seiner speklralen Eigenschafien von 
dem ungefiltcnen zeildiskreten Audiosignal unierscheidet. 

Dcr in dem Schritt (c) durchgefuhrle Vergleich dient zum Erfassen eines zeillichen Anstiegs dcr Signalenergie, d. h. 
zur Anstiegsdciekiion, wahrend der in dem Schritt (d) durchgefuhrle Vergleich zur Erfassung des Anstiegs von Signal- 
anteilen eines bestimmien Frcquenzbereichs, d. h. zur Spektraldetektion, dient. 65 

Der in dem Schriti (d) durchgefuhrle Vergleich dient dagegen dazu, frcquenzabhangigc Eifckic dcr zcitlichcn Maskie- 
rung zu beriicksichtigen. An diescr Sielle sei angemerkt, daB die Zeitauflosung des menschlichen Ohrs frequenzabhangig 
ist. Die Zeitauflosung isi grob gesprochen bci sehr niedrigen Frequenzen relativ gering und sieigt mit zunehmender Fre- 
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quenz an. Fur den Fall cincs Vorcchos bcdcuici dies. daB ein durch die Quaniisierung eingefuhrtes Rauschen. das zu ei- 
neni Vorecho in einem hcsiinimicn zcillichcn Absiand vor eineni Anschiag iuhru bci niedrigen Frequcnzen cher nichi er- 
faBi wird, da das Ohr hicr eine zeiiliche Auflosung hai. die prober als der besiinmue zeiiliche Absiand des Vorcchos isi. 
Anders geariei isi der 1 "all, wenn cin Anschiag cher im hoherfrequenicn Bereich siattlindcl. ITier ist die Zeiiaullosung des 
5 n i en sch lichen Oh res feiner, wodurch ein Vorecho in den i hesiimntten /cit lichen Absiand horbar sein kann, da die Zeii- 
aullosung des Ohrs bcreiis feiner als der zeiiliche Absiand des Vorcchos vom Anschiag sein kann. Es bleibi also festzu- 
stellen, daB die Spcktraldctckiion im Gegensatz zur Anstiegsdctekiion die frequenzabhangige zeiiliche Aullosung des 
Ohrs nachbildei, wodurch eine genauere Anschlagserfassung als mil der Anschlagsdeickiion all ein moglich ist. In nian- 
chen Fallen kann sclbst versiandlich auch die Anschlagsdeieklion alleine bercils zulriedcnsicllcndc Hrgebnisse lietern. 
10 An dieser Sielle sei angemcrki, daB ein Anschlag cntweder auf der Grundlage des in dem Schriii (c) durchgefuhnen 
Vergleichs oder aul der Grundlage des in dem Schritt(d) durchgefuhnen Vergleichs odcr auf der Grundlage beider Ver- 
gleiche durchgefuhrl werden kann. 

Hevor/.ugie Ausfuhrungsheispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend aul die heiliegen- 
den Zeichnungcn dciaillierler erlautcrt. Es zeigen: 
15 Fig. 1 einen Transfonnaiionscodierer, der die Anschlagserfassung im Zciibereich umfaBt: 

Fig. 2 eine detaillienere Darsiellung der in Fig. 1 enthaltenen Anschlagserfassung im Zciibereich; 

Fig. 3 einen Transformaiionscodierer, der ein bckannies Vcrlahren zur Anschlagserfassung umfaBt; und 

Fig. 4 einen weiteren Transfonnaiionscodierer, der ein andcres bekanntes Vcrfahren zur Anschlagserfassung aufweist. 

Fig. 1 zeigt einen Transfonnaiionscodierer 10 geniaR der vorliegenden Krfindung, welcher sich bis auf einen Block 
20 Anschlagserfassung 12 nichi von ublichen in der Technik bckannten Transformationscodierern unierschcidci. Insheson- 
derc sind die Funklionen und Verknupfungen der Blockc Zcit/Frequenz-Transformalion 104. Quanlisierung/( \xiierung 
106, Bitsiromformaiierung 108 und psychoakuslisches Modcll 110 in der Technik be kann t . Die Funkiionswcisen der ein- 
zelnen Blocke wurden bereits in Verbindung mil den Fig. 3 und 4 beschrieben und werden daher nichi noch einmal ex- 
pliz.it erklart. 

25 Wie es in Fig. 1 gczeigi isi, erhalt der Block Anschlagserfassung 12 als Eingangssignal das zeitdiskreic Audiosignal 
Liber den Eingang 102 des Transformalionscodierers 10. Der Block Anschlagserfassung 12 liefert als Ausgangssignal ein 
Signal, das anzeigi, ob cin langcs odcr kurzes Fcnsicr fur die Fen sterling und anschlicBcndc Zci l/Frcqucn /.-Iran sf on na- 
tion 104 lest zulc gen isi. 

Fig. 2 zcigt eine dctaillierte Ansichi des Blocks Anschlagserfassung 12 von Fig. L Das zeitdiskreic Audiosignal x(k). 

30 das an dem Ausgang 102 des Transfonnalionscodierers 10 (Fig. 1) anliegl, wird in eine Segmcnlierungseinrichtung 14 
eingespeisl, welchc ant Ausgang aufeinanderfolgende Segmentc der Langc S ausgibt. Ein Segment umfaBt daher die An- 
zahl S von zeitdiskreten Abtastwerlcn des Audiosignals und wird als xs(T) bczeichnet, wobei "T" darstclll, daB es sich 
beim Signal xs(T) um das akiuclle Segment handelt. wahrend "T-J" anzeigi, daB es sich um ein dem aktuellen Segment 
zeitlich unmittelbar vorausgehendes Segment handelt. "T-2" bedeutet analog, daB das Segment mil "T-2" das zweii.let.zte 

35 Segmenl vor dem aktuellen Segment ist. 

Das Signal xs(T) wird femer in ein FIochpaBfiltcr 16 einerseils sowie in eine Spekiraldetektionscinrichtung 18 ande- 
rerseits eingespcist. Das Ausgangssignal ys(T) des HochpaBfi Iters 16 wird wiederum zum einen in eine Anstiegsdctekti- 
on sei nrich lung 20 einerseils und in die Spektraldetektionseinrichtung 18 andererseits eingespeisl. Das Ausgangssignal 
der Anstiegsdeiekiionseinrichtung 20 wird ebenso wie das Ausgangssignal der Spektraldetektionseinrichtung 18 einer 

40 Anschlagserfassungscinrichtung 22 zugefuhrt, welchc als ODER-Gatter ausgefuhrt sein kann, wie es durch das Symbol 
"v" symbolisch in Fig. 2 gczeigi ist. Das Ausgangssignal der Anschlagserfassungsvorrichtung 22 enlsprichl dem Aus- 
gangssignal der Anschlagserfassungseinrichtung 12 von Fig. 1 und wild dem Block Zeil/Frequenz- Transformation 104 
sowie dem Block psychoakustisches Modcll 110 zur Verfugung geslellt. 

Im Nachfolgenden wird auf die Funktion und den Aufbau der einzelnen in Fig. 2 gezeiglen Elemente eingegangen. 

45 Die Seqmcnticrungseinrichtung 14 teilt das Eingangssignal x(k) in aufeinanderfolgende Segmentc x s (T). x s (T-l). 
x s (T-2), . . . gleichcr Lange S ein. Das zeitdiskrete Audiosignal x s (T) in einem aktuellen Segment (T) umfaBt son lit S zeit- 
diskrete Ablastwcrle des zcildiskretcn Audiosignals x(k) am Eingang 102, wobei die Segmenllange S unabhangig von 
der Blocklange der Zeit/Frequenz-Transforniation gewahlt werden kann. Insbesondere ist es im Gegensatz zum Stand 
der Technik nichi crforderlich. als Segmenllange z. B. die kurze Blocklange oder die lange Blocklange zu wahlen. Die 

50 Segmenllange S kann im Bereich von 200 bis zu 2000 Ablastwerten liegen. wobei eine Segmenllange S von etwa 500 
Abtastwerten bevorzugi wird. 

Das HochpaBlilter 16 crfulli im wesent lichen zwei Aufgahen. Die Anstiegsdetekiion (Block 20) soil einen An si i eg in 
der HLillkurve der Signalenergie deleklieren, nichi jedoch dem Amplitudenvcrlauf eines tieflrequentcn Signales folgen. 
Liegl nun die Schwingungsdauer eines Signalantcils in der.GroBenordnung der Segmenllange oder daruber, wurde umer 

55 Umstiinden eine Fehldciektion eines Anschlags crlolgen. Der Frequenzgang des HochpaRfilters 16 sollte somit vorzugs- 
weise eine genugende Sperrdamptung im unteren Frcquenzbereich besitzen. Mil zunehmender Sequenzlange S kann zu- 
dem die Grenzfrcquenz des Filters weiter verringert werden. Andererseits werden die Energien des liochpaBgefilterten 
Zx;itsignals y s (T) wciterhin als VcrgleichsmaB fur die Spektraldetektion (Block 18) benotigt. 

Beziiglich der Flankensteilheit und Welligkeit im DurchlaBbereich kann das Filler sehr maBige Eigenschafien aufwei- 

60 sen, wobei jedoch ein lineares Phasenverhalten bevorzugt wird. Bei einer bevor/ugten Segmenllange von etwa 500 Ab- 
tastwerten wird bci einem bevorzugten Ausfuhrungsbeispiel der vorliegenden Erfindung ein nichi rekursives, linearpha- 
siges FIR-Filter der Lange 7 mil den Filterkoeffizicntcn -0.2136, -0,0257, -0,0265, -0,5713, -0,0265. -0,0257,-0.2136 
verwendet werden. Die Lange des FLR-Fi Iters des bevorzugten Ausfuhrungsbeispiel ist jedoch nicht auf den genannten 
Wert eingesehrankt. Fur manche Falle diirften auch Filter mit geringerer Langc ausreichen, wahrend in wieder anderen 

65 Fallen deutlich mchr Filterkoeffizienten erwunscht sein konnten. 

Wciterhin wird bevorzugt, daB die Filterlange klein gcgenuber der Segmenllange S ist. In diesem Fall kann namlich 
die Filterlaufzeit vernachlassigt werden, wodurch eine weitere Komplexilat des Transfonnalionscodierers 10 vermieden 
■ werden kann. 



BNSDOCID: <DE_19736669C1 J_> 



1 



DE 197 36 669 C 1 

Die Scgmenie werden durch cin nichi rekursives. cii^iialcs Filter, wie es bcrcils crwahni wurdc. mil cincr schr kurzen 
Fillcrlange im Vergleich zur Segmenllange von lieffrequenien Antcilcn befreil. Fur die Ausgangsfolge des Fillers y^'V) 
erg i hi sich folgende Gleichung: 

v s (T> = \ s rr)xh(k) (2) * 

h(k) sielll in Gl. (2) die Impulsaniwort des Fillers dar, wahrend k der Fillcrlange enlsprichl. Das Ausgangssignal y s (T) 
enisiehi also aus der Faltung des Fingangssignals x s CD mil der Impulsaniwori h(k) des HochpaBfilters 16. 

In der Anstiegsdeiektionseinrichlung 20 wird zunachsi aus den gelilierien Hingangsdaien y s (T) uberein Skalarproduki 
die Fnergie E t (T) des geradc voriiegenden Segmentcs, das aueh als akiuelles Segmeni be/.eiehnei wird. berechnei. Fin io 
Vergleich mil der Fnergie E^T-l) des dem aktuellen Segment vorausgehenden Segments sowie mil der Fnergie F ; <T-2) 
des zweitletzten vorausgehenden Segments lieferi nun das Kritcrium fiir den Fnergieansticg in dem zeiidiskreien Audio- 
signal von einem Segment, zum naehslen. Der Ausdmck fiir das ersie Kriierium oder kritA lautct sontit folgendernialSen: 

kritA=[E t <T)>k ] • Fi<T-F»] A [E,<T)>k2 • E,<T-2)| A [EKT)>K ininF ] (3) 15 

Fntsprechend der ubiichen Notation bedeutct "v" einc logischc ODER-Vcrknupfung wahrend " A" eine logische UN1> 
Verknuplung bczeichnet. Der letzte Term der Glcichung 3 bczeichnet einen Vcrgleich der aktueJlen Fnergie des t.iefpati- 
gcfiltcricn, /.eitdiskreten Audiosignals in dem aktuellen Segment mil einer Fdier-Mindcstencrgie F mill |.-. Dieser Vergleich 
bewirkt, daB das Kritcrium A nur berucksiehtigt wird. wenn die aktuelle Scgmentencrgie eine Mindestenergie ubcr- 20 
schrciici. Der Wert der Konstanten E )nill F kann vorhcr feslgclegl werden und basiert in vereinfachter Form auf dem Fin- 
fluB der Ruhehorschwelle auf die Wahrnehmung. Die Mindestenergie fiir den konstanten Wert F millf - kann dahcr vorzugs- 
weise im Bereich von -80 dBFs liegen. 

Die in dent Block 18 ausgefiihrte Spektraldeiekiion basiert dagegen auf einem Vergleich von gcfilterlcn und ungefil- 
terten Scgmentenergien des aktuellen Segments mil gelili.en.cn und ungenTterlen Segmentcnergicn des vorhergchenden 25 
Segments. In Glcichungsform ausgedruckl crgibt sich folgende Vorschrifl fur das zweile Kriierium krilB: 

EAT) EAT-1) 
kritB = > k, • / 3 a[£ u (D > E^ nU ] ( 4 ) 

In dieser Glcichung slellt E U (T) die Energie des aktuellen ungefilterten Segments dar, wahrend Fj<T) die Fnergie des 
hochpaBgefilterten aktuellen Segments, d. h. die Energie des hochpaBgefiltcrten zeitdiskreten Audiosignals im aktuellen 
Segment, darstelli. Der letzte Term der Gleichung (4) berucksiehtigt wieder den Fall, daB keine Fensterumseliahung aus- 
gelost wird, wenn die Energie des ungefilterten zeitdiskreten Audiosignals im aktuellen Segment untcr einer Minimal- 35 
energie E m j„u fur ungcfilierte Signale liegl, welche wiederum auf der Ruhehorschwelle basiert und ebenso wie die Filter- 
Minimalencrgie E in i nF eincn Wert von -80 dBFs annehmen kann. 

In den Gleichungen (3) und (4) sind ferncr verschiedene Konstanten k| bis k 3 genannt. Mitlcls dieser Konstanten wird 
feslgclegl, wieviel groBcr die Energie des aktuellen Segments bzw. das aktuelle Verhaltnis zwischen gefiltertcr Energie 
und ungcnlterter Fnergie im Vergleich zu dem en t spree henden Wert des vorausgehenden Segmcnie sein muB, damit ein 40 
Anschlag crfaRt wird, durch den eine FensterumschaJtung von langen zu kurzen Fenstern bewirkt wird. ^ 

In der Praxis haben sich Werte fur die Konstanten kj und k^ von vier als giinslig erwiesen, welche damit einem ent- 
sprechenden Pcgelun terse hied von 6 dB entsprechen. Lediglich vorzugsweise kann die Konstante k 2 . also der Vcr- 
gleichswert mil der vorletzien Segmcntenergie, auch etwas kleiner als vier gewahlt werden, um beispielsweise einen 
Wert von drei anzunchmen. Es wir jedoch darauf hingewiesen. daB die Werte fiir die Konstanten kt bis k3 abweichend 45 
von den genanntcn W T erten eingestellt werden kdnnen, wenn cine fcinere bzw. grobere Anschlagscrfassung gcwunschl 
wird. Fur eine korrekte Funktionsweise der Anschlagscrfassung der vorliegcnden Erfindung ist es jedoch crforderlich, 
daB die Werle der Konstanten k[ bis k-* groBcr als eins eingestellt werden, wie es aus den Gleichungen (3) und (4) ersichl- 
lich ist. 

An dieser Stclle sei angemerkt, daB das Kriierium A (kritA) und das Kriierium B (kritB) lediglich auf dem jewcils er- 50 
stcn Tern] der Gleichung (3) und (4) basiercn konnen. Die weiteren bciden Tenne in der Gleichung (3) sowie der weitcrc 
Term in der Gleichung (4) dienen lediglich einer ausgefeilteren Anschlagscrfassung, um sicherzusicllen. daB moglichst 
wenig Anschlage erfaBt werden, um moglichst scltcn zu den kurzen Transfonnationsfensiern umschalten zu miisscn. 

Um den EinfiuB von Schwebungcn auf die Anstiegsdelektion zu minimieren, ist der Vergleich der gefikerten Encrgien 
nicht nur mil der zeitlich vorhergchenden Segmcntenergie Ej<T-l) sondern zusalzlich mil dem vorletzien Energiewerl 55 
Hfi'V-2) bci der gewahlten Segmentlange wiinschcnswcri. Hicr wird der Ellekl der zcitlichcn Nachverdeckung bei kurz 
aufeinanderfolgenden Anschlagen beriicksichtigi, wenn ein poieniiclles Vorecho vor einem zweiien Anschlag noch vom 
ersten Anschlag maskien wird. Der zweite Term in Gleichung (3) stellt fiir die Funktion der voriiegenden Erfindung kei- 
nen wescnllich Term dar, sondern lediglich eine voneilhaftc Ausgcstaltung. Dasselbe trifft fur die jeweils letzten Tenne 
der Gleichungen (3) und (4) zu, welche das Frfassen eines Anschlags von IvTindestenergien abhangig machen, die der 60 
Ruheschwclle nachempfunden werden. 

An dieser Stclle sei noch einmal bctonl, daB die Vcrwendung des HochpaBfilters lediglich beispielhaft wenn auch be- 
vorzugi ist. Anstelle des HochpaBfilters konnte gcnausogul ein DitTerenzierer eingeselzt werden, der allgemein ausge- 
druckl dazu fuhrt, daB im differenzierten Signal hoherfrequente Signaianteile starker zutage ircten als im nicht-differen- 
zienen Signal. Eine weitere Alternative fur das HochpaBfilter ware ein BandpaB filter, das dazu fuhrt, daB die Energie des 65 
bandpaBge filter! en Signals in einem bestimmten Spektralbercich konzentriert ist. Diese Aufzahlung der Altcmativen fur 
das HochpaBfilter des bevorzugten Ausfiihrungsbeispiels ist jedoch nicht erschopfend. Voraussetzung fur das Verfahren 
der voriiegenden Erfindung ist, daB das Signal im Zeilbereich verarbeitel. d. h. gefilien wird, und zwar derart. daB es sich 
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hinsichilich seiner spekiralcn Eigenschaftcn von deni nichi verarbeilctcn. d. h. ungenlierten Signal unierscheidei. Der 
Ausdruck "1 ilicrn* isi dahernichi dcrari begrenzend aufzufassen, daB der Icdiglich einc Qhliche Filterung /.. H. nmiclsci- 
ncs Ilochpasses unifaBu sondcm daB cr auch andere Verarheiiungen. wic z. B. Dilferenzicrungen, umlaBi. die dazu luh- 
ren, daB sich cias vcrarbcilclc Signal hinsichilich seiner spekiralcn liigenschaficn von deni nichi vcrarbeiieien unierschei- 

( L Weiierhin sci darauf hingewiesen, daB die Einrichiung 22 /.uin Erfassen cines Anschlags nichi unbedingi als ODER- 
Gatier ausncfuhrt sein muB. Diesetbe kann z. B. als UND-Galtcr ausgefiihrt sein. In dicsem Fall wird nur dann ein An- 
schlag erfaBt. wenn bcide Kriiericn erfullt sind. In dicsem Fall wurden vorzugsweise die Konsianien k,, k : und/oder k 3 
und/oder die Mindesicnergien vcrklcincn werden. was dazu l'uhrt, daB jedes Kriiericn fur sich cmlachcr ertulli wird. bin 

10 jedoch kcinc unnoiigcn odcr zu haufigen Umschaltungcn auf kurzerc Fenstcr zu bewirken. wird dann ein Anschlag nur 
erfaBt. wenn bcide Kriiericn in eineni Segment gleichzeitig erfaBt werden. 

Die vorliegende Erfindung schafft soniii einc Deiektion von Anschlagen in Audiosignalcn aus der Zciisignallolge, 
welchc ausschlicBlich ini Zciibcreich stairfindei. Die Anschlagserfassung bictct daher gegeniiber dem Stand der Techmk 
den Vortcil. daB keine FVT mil einer vorbcsiinmiien Transformationslange benotigt wird. Das Vcrlahren der vorhegen- 

t s den Erfindung kann soinit auBerst sparsani ini Hinblick auf die vcrfugbaren Rechnerressourcen implemeniieri werden, da 
das vcrwen del eFIR-Fi Iter einfach zu realisieren isi. 

Pateni anspruche 

20 1. Vcrlahren zum Erfassen eines Anschlags in eineni zeitdiskreten Audiosignal (x(k)), mil folgcndcn Schritien: 

(a) Scginentiercn des zeiidiskrcten Audiosignals. urn aufeinandcrfolgendc Segmenic gleieher Lange mil un- 
gclilienen zeiidiskreien Audiosignalcn (x s (T), x s (T-l), x s (T-2) ) zu erzeugen; 

(b) Filtern des zeiidiskrcten Audiosignals (x s (T)) in einem aktuellen Segment; 

(c) Vergleichen der Energie (Et<T)) des gefilicrten zeiidiskreien Audiosignals (y s (T>) in deni aktuellen Seg- 
25 nient mil der Energie (EffT-l)) des gefiltertcn zeiidiskreien Audiosignals (y s (T-l)) in einem vorhergehenden 

Segment; und/oder 

(d) Bcsiimmen cincs aktuellen Verhallnisscs zwischen der Energie (E t <T)) des gefilicrten zeiidiskrcten Audio- 
signals (yXr» in deni aktuellen Segment und der Energie (E ll (T)) des ungefilterten zeiidiskreien Audiosignals 
(x s (T)) in dem aktuellen Segment und Vergleichen des aktuellen Verhaltnisses mil einem entsprcchcndcn vor- 

M) herechenden Verhaltnis; und 

(e) ' Erfassen eines Anschlags auf der Grundlage des ini Schritl (c) und/oder (d) durchgefuhrten Verglcichs. 

2. Vcrlahren nach Anspruch 1, bei deni der Schritl des Filtern ein HochpaBfiltem des zeiidiskreien Audiosignals 

unifaBi. ci- \ 

3. Vcrfahren nach Anspruch 1 oder 2, bei deni im Schritl (e) ein Anschlag erfaBt wird, wenn der in dem Sennit (c) 
35 durchgefuhrte Verglcich ergibt, daB die Energie (ErfT)) des gefilicrten zeiidiskreien Audiosignals (y s (T)) in dem ak- 
tuellen Segment groBcr als die Energie (E^T-1)) das gefilicrten zeitdiskreien Audiosignals (y s (T-l)) in eineni vor- 
hergehenden Segment ist. 

4. Vcrfahren nach Anspruch 1 oder 2, 

bei dem in Schritl (c) ferner die Energie (Ef(T)) des gefilterlen zeitdiskreten Audiosignals (y s (T)) in deni aktuellen 
40 Segincni mil. der Energie (Ef(T-2)) eines gefiltertcn zeiidiskrcten Audiosignals (y s (T-2)) in eineni zweitletzlen vor- 

hergehenden Segment verg lichen wird, und 

bei deni ini Schritl (c) nur dann ein Anschlag erfaBt wird, wenn die Energie (EKT» des gefilterlen zeiidiskreien Au- 
diosicnals (v,(T» in dem aktuellen Segment sowohl groBer als die Energie (Ef<T-l)) des gefilterlen zeitdiskreten 
Audiosignals (y s (T-l)) in dem vorhergehenden Segment als auch groBer als die Energie (E t <T-2)) des zeitdiskreten 
45 Audiosignals (y s (T-2)) in deni zweitletzlen vorhergehenden Segment ist. 

5. Vcrfahren nach Anspruch 1 oder 2, 

bei dem im Schritl (c) femer die Energie des geiilierten zeiidiskrcten Audiosignals ini aktuellen Segment mil eineni 
vorbestimmten Filierminimalwert (E initlF ), der auf der psychoakustischen Ruhehorschwelle basiert, verglichen wird, 
und 

50 bei dem im Schritl (c) nur dann ein Anschlag erfaBi wird. wenn die Energie des gefilterlen zeitdiskreten Audiosi- 

gnals in dem aktuellen Segment sowohl groBer als die Energie des gcfilierten zeitdiskreten Audiosignals in dem vor- 
hergehenden Segment als auch groBcr als die Energie des gefilterlen zeitdiskreten Audiosignals in deni zwcitlelzten 
vorhergehenden Segment als auch groBer als der vorbestimmte Filter-Minimal wert (E m j n F) isi. 

6. Vcrfahren nach einem der voriiergehenden Anspruche, bei dem die Energien. die jeweils mit der Energie des ge- 
55 filierten zeiidiskreien Audiosignals im aktuellen Segment verglichen werden, mit Faktoren (ki, k 2 ) gewichtet wer- 
den. die groBer als ein s sind. 

7. Vcrfahren nach eineni der vorhergehenden Anspruche, bei dem im Schritl (e) ein Anschlag erfaBt wird, wenn der 
in dem Schritl (d) durchgefuhrte Verglcich ergibt, daB das aktuelle Verhaltnis groBer als das vorhergehendeenispre- 
chende Verhaltnis ist. 

60 8. Vcrfahren nach einem der Anspruche 1 bis 6. 

bei deni in dem Schritl (c) ferner die Energie (E,,(T) ) des ungefilterten zeitdiskreten Audiosignals (x s (T)) in dent ak- 
tuellen Scgmeni mil einem vorbestimmten Minimalwcrt (E^uX der auf der psychoakustischen Ruhehorschwelle 
basieri, verglichen wird, und 

bei dem ini Schritl (e) nur dann ein Anschlag erfaBt wird, wenn sowohl das aktuelle Verhaltnis groBer als das eni- 
6S sprechende vorherige Verhaltnis isi, als auch die Energie (E U (T)> des ungefilterten zeitdiskreten Audiosignals 

(x s (T)) in d eni aktuellen Segment groBer als der vorbestimmte Minimal wert (E, ninU ) ist. 

9. Vcrfahren nach Anspruch 7 oder 8, bei dem das vorhergehende Verhaltnis mit einem vorbestimmten Faktor (k 3 ), 
der groBer als eins ist, gewichtet wird. 
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10. Verlahren nach cine mi der vorhcrgchcndcn Anspriichc, bci dem das IToehpatilihcrn mil ids cincs FIR-Fihers 
durchgefuhrt wird. 

1 1 . Vorrichiung (12) zum Erfassen cincs Anschlags in cincin zeiidiskrcien Audiosignal (x(k)> mil folgenden Merk- 
mulcn: 

(:») cincr Einrichiung (14) y.uin Segmcniiercn des zeildiskretcn Audiosignals (x(k)). inn nuleinanderfolgende 
Scgnicnic mil . gleicher Liinge mil ungelilterien zeildiskretcn Audiosignalen (x s (T). \ S (T-I ), \ s (T-2), . . .) zu er- 
zeugen; 

(b) cincm Filler (16) zum Filicrn des zeiidiskrcien Audiosignals (x s (T)) in cincin akiucllcn Segment; 

(c) cincr Ansiiegserfassungseinrichiung (20) zum Vergleichen dcr Energie (HK 1')) des gciilicricn /cildiskrcicn 
Audiosignals (y s (T)) in dem akiucllcn Segment mil dcr Energie (Ef(T-l )) des gciilicricn /cildiskrcicn Audiosi- 
gnals (y s (T-l)) in cincin vorhcrgchcndcn Segment.; und/odcr 

(d) cincr Spekiralerfassungseinrichiung (18) zum Besiimmen eines akiucllcn Vernal misses zwischen dcr 
Energie (Ef(T)) des ungefihencn zeiidiskrcien Audiosignals (y s (T)) in dem akiuellcn Segment und der Energie 
(E M (T)) des gcfilterten /cildiskrcicn Audiosignals (x K (T)) in dem akiucllcn Segment und Vcrglcichcn des akiu- 
cllcn Vcrhalinisscs mil cine in vorhcrgchcndcn cntsprcchcnden Verhaltnis; und 

(e) cincr Einrichiung (22) zu Erfassen cincs Anschlags auf der Grundlagc des durch die Ansticgscrfassungs- 
cinrichtung (20) und/oder des durch die Spekiralerfassungseinrichiung (18) durchgefuhrten Vcrglcichs. 

12. Vorrichiung (12) nach Anspruch 11. bei dem das Filler (16) ein HochpaG-FTR-Filier mil lincarcm Phascnver- 
halien isi. 

13. Vorrichiung nach Anspruch 1 1 oder 12, bei dem die Einrichiung (22) zum Erfassen cincs Anschlags als UND- 
oder als ODER-Gaiier ausgcfuhri ist, wobci in Eingangc des ODER-Ciatters bzw. TJNF)-(i alters Ausgangssignale 
(kritA, kriiB) dcr Ansiiegscrlassungscinrichiung (20) und dcr Spekiralerfassungseinrichiung (18) cingespeist wcr- 
den. 

14. Vorrichiung (10) zum Codicren cincs zeiidiskrcien Audiosignals, mil folgenden Mcrkinalcn: 

(a) cincr Anschlagserfassungseinrichiung (12) zum Erfassen eines Anschlags in dent zeildiskreicn Audiosi- 
gnal nach einein dcr Anspriichc 10 bis 12; 

(b) cincr Einrichiung (104) zum Fen stern des zeildiskretcn Audiosignals, urn Blockc von zeildiskretcn Audio- 
signalcn zu erzeugen. die auf die Anschlagserfassungseinrichiung (12) anspricht, urn ein kurzes Fenster zum 
Fcnsiern zu verwenden. wenn die Anschlagserfassungseinrichiung (12) eincn Anschlag crfatii: 

(c ) cincr Einrichiung (104) zum Zcit/Frequenz-Transformicren der Blockc des zeiidiskrcien Audiosignals, urn 
Blockc von Speklralkomponcnlcn zu erzeugen; und 

(d ) ciner Einrichiung (106) zum Quantisieren und Codieren der Blocke von Spekiralkomponcnien. 
\5. Verlahren zum Codicren eines zeildiskretcn Audiosignals mit folgenden Schriticn: 

(a) Erfassen cincs Anschlags nach einein der Anspriichc 1 bis 9; 

(b) Fenstcm des zeildiskretcn Audiosignals nut einein kurzen Fenster, wenn ein Anschlag erlaBi wurdc, und 
mil cincin langcn Fesicr, wenn kein Anschlag erfaRt wurdc, um Blocke von zeiidiskrcien Audiosignalen zu er- 
zeugen; 

(c) Trans formic ren der Blockc des zeiidiskrcien Audiosignals von dem Zeil- in den Frequenzbereich, uni 
Blockc mil Speklralkomponcnlcn zu erzeugen; und 

(d) Quantisieren und Codicren dcr Blockc von Spektralkomponenten, um ein codiertes Audiosignal zu erhal- 
icn. 



Hierzu 2 Seite(n) Zeichnungen 



45 



50 



55 



60 



65 



7 

BNSDOCID: <DE__19736669C1 J_> 



- Leerseite 



BNSDOCID: <DE 19736669C1 J_> 



ZEICHNUNGEN SEITE 1 



Nummer: 
Int. Cl. ti : 

Veroffentlichungstag: 



DE197 36 669 CI 
G 10 L 5/00 

22. Oktober 1998 



10 



102 



104 



106 



108 



« ► 



Zeit/Frequenz- 
Transformation 
(lang/kurz) 



Quantisierung/ 
Codierung 



Ausschlags- 
erfassung 



Psycho- 

akustisches 

Model! 



Bitstrom- 
formatierung 



110 



12 



FIG.1 




102 



14 



Segmentierung 



X S (T) 



16 



Hochpafc- 
Filter 



12 



Y S (T) 



* ► 



20 



Anstiegs- 
Detektion 



kritA 



Y S (T) 



X S (T) 



Spektral- 
Detektion 



kritB 



22 



18 



FIG-2 



802 143/272 



BNSDOCID: <DE_19736669C1 _l_> 



ZEICHNUNGEN SEITE 2 



Nummer: 
Int. Cl. b : 

Veroffentlichungstag: 



DE 197 36 669 C1 
G 10 L 5/00 

22. Oktober 1998 



100 



102 



104 



106 



108 



—L — ► 


Zeit/Frequenz- 
Transformation 
(lang/kurz) 




Quantisierung/ 
Codierung 


► 


Bitstrom- 
formatierung 


► 




► 







*— " 














Psycho 






Bitbedarfs- 


► 


akustisches 




Schatzung 




Model! 




— ► 







110 



112 



FIG.3 (Stand der Technik) 



102 



104 



106 



108 



150 



Zeit/Frequenz- 
Transformation 
(lang/kurz) 



FFT-Transformation 
und Detektion 
aus dem Spektrum 



Quantisierung/ 


Codierung 






A 


/ 


Psycho 




akustisches 


Model! 





Bitstrom- 
formatierung 



110 



152 



FIG.4 (Stand der Technik) 



802 143/272 



BNSDOCID: <DE_19736669C1_I_> 



This Page is Inserted by IFW Indexing and Scanning 
Operations and is not part of the Official Record 

BEST AVAILABLE IMAGES 

Defectiye images within this document are accurate representations of the original 
documents submitted by the applicant 

Defects in the images include but are not limited to the items checked: 

□ BLACK BORDERS 

Q IMAGE CUT OFF AT TOP, BOTTOM OR SIDES 

□ FADED TEXT OR DRAWING 
Y^M$LURRED OR ILLEGIBLE TEXT OR DRAWING 

_ SiS]PWEP^ ' '3'-" 

^iD COLOR OR BMGK AND WH 

□ GRAY SCALE DOCUMENTS - • ; ._• 

□ LINES OR MARKS ON ORIGINAL DOCUMENT 

□ REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY 

□ OTHER: ■ 

IMAGES ARE BEST AVAILABLE COPY. 
As, rescanning these documents will not correct the image 
problems checked, please do not report these problems to 
the iFW Image Problem Mailbox. 



